查看原文
其他

为啥你高考考那么烂? 温度惹的祸还是背的锅?

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!
正文
关于下方文字内容,作者:施王金羽,南京大学环境学院,通信邮箱swjy990221@163.com
Joshua Graff Zivin,YingquanSong,QuTang,PengZhang,2020. Temperature and high-stakes cognitive performance: Evidence from the national college entrance examination in China,Journal of Environmental Economics and Management.
We provide the first nation-wide estimates of the effects of temperature on high-stakes cognitive performance in a developing country using data from the National College Entrance Examination (NCEE) in China. The NCEE is one of the most important institutions in China and affects millions of families. We find that a one-standard-deviation increase in temperature during the exam period within counties (2 °C/3.6 °F) decreases the total test score by 0.68%, or 5.83% of a standard deviation, with effects concentrated on the highest performing students. This suggests that temperature plays an important role in high-stakes cognitive performance and has potentially far-reaching impacts for the careers and lifetime earnings of students.
Abstract:作者使用来自中国高考(NCEE)的数据,提供了有关温度对发展中国家高风险认知表现影响的第一个全国范围的估计。作为中国最重要的筛选机制之一,高考影响着全国数以百万计的家庭。作者发现,在考试期间,考生所在县城温度增加一个标准偏差(2℃/ 3.6℉)会使总成绩降低0.68%,即一个标准偏差的5.83%,且影响集中在高分群体。这表明温度对高风险认知表现有着重要影响,并且潜在地对学生的职业生涯和终身收入产生深远的影响。
Introduction
由于气候变化引发的全球变暖会导致全球平均气温升高和大尺度极端温度事件频发,这一威胁催生了一系列关注气温变化影响的经济学研究,但是,认知表现,这一与日常生活息息相关的领域相对而言尚未被探索。
理论上,环境条件会通过一些相关的渠道影响认知表现。大脑化学,电学性质和功能都是温度敏感的,同时,热暴露会导致注意力,记忆力,信息保留和处理,以及完成与精神相关任务的能力下降,其中,热应力对工作记忆性能的影响尤为重要,因为具有挑战性的认知任务深度依赖工作记忆进行多步处理。
本文作者使用中国高考(NCEE)的数据,提供了发展中国家第一手的全国范围的对于温度对高风险认知行为的估计,因为在中国高考由于其显著的特征,被认为非常适用于评估温度对认知表现的影响,并且能够很好地消除潜在的内生性问题。同时,作者获取的数据集涵盖了2005年至2011年间来自中国2227个县城被录取的大学生,产生了超过1400万个观测值。该数据集同时记录了每个学生的考试成绩(范围从0到750)和所在县城。然后,作者将此数据集与分布在全国的752个气象站的温度,降水,相对湿度,风速,日照时间,压力和能见度的每日天气数据进行匹配。
研究发现,在经济学和统计学意义上温度对于考试成绩都有显著的负面影响。具体而言,考试期间,考生所在县城温度增加一个标准偏差(2℃/ 3.6℉),使总成绩降低0.68%,即标准偏差的6%。并且这一影响在中国六月初平均温度23.21℃时大致呈线性关系。鉴于温度对考试成绩的显著负面影响,作者进一步探究了温度对学生成绩是否达到一本大学的录取分数的影响,结果发现,考生所在县城温度每增加一个标准偏差使,进入一流大学的可能性降低1.2%。这一系列结果表明温度对高风险的认知表现起着重要影响,并且对学生的未来职业生涯和终身收入可能具有深远的影响。作者同时指出,在中国,较热的地区会受到现有制度的不公平惩罚,而且气候变化会进一步加剧这一不公平性。作者认为可以采取的应对政策时安装和使用空调。
本文的研究建立在一小部分已有的经济学文献的基础上。尽管已有的对于发达国家的研究已经说明了温度的影响,但是发达国家空调普及程度较高。本文对中国研究的结果表明考试期间1℃温度的升高会造成考试成绩2.91%的下降,这一结果大致是美国的2倍。同时,作者的研究也补充了最近在印度开展的针对温度会影响农业产量和营养的研究。
因此,本文的研究工作最主要的贡献在于关注了发展中国家全国范围较短时间尺度上的高风险测试,并且排除了其他潜在可能损害认知行为的因素的影响。作者的研究成果也对更为普遍的开展针对标准考试行为的研究有重要意义,特别是在考虑空气污染的对学习行为的影响时,温度也应当被作为一个重要的因素加入其中。
Empirical Background
高考(NCEE):研究期间(2005-2011),各省常见考试形式是每年6月7日和8日举行,总分750分,按照“3+X”的模式考试,即语文、数学、外语各占150分,理科学生考理综(生物、化学、物理)占300分,文科学术考文综(地理、历史、政治)占300分。
高考(NCEE)的高风险性:它几乎是中国学生进入高等教育的唯一途径。在中国,每年有大约900万学生通过考试竞争2300所学校的入学资格,包括普通高校和职业高校。尽管总的录取率在57%-72%之间,普通高校的录取率仅占30%左右。普通高校又分为三个批次(一本、二本和三本)一本学校录取时间较早,且录取分数相对较高。
录取分数:录取分数指的是学生申请进入该批次大学的最低分数,文理科在不同省份每年不同批次的录取分数线会有变化,由省教育厅根据当年的录取份额和学生成绩分布决定。因此,任何暴露于极端温度下的分配效率低下都是由某一省份内各县城的温度差异导致。并且由于西部省份占地更广,天气的变化也大于东部省份,这些省内的分配效率低下也可能导致区域间的不公平。
在作者选取的研究时间段内,一本类高校涵盖了所有的精英大学和隶属于教育部或其他国家部委的重要机构。近年来,一本大学的录取率在12%左右,甚至低于较早的年份。已有的研究证明,高考成绩越高,学生进入一流高校的可能性越大,同时与未来的机遇和薪资潜力高度相关。
Data
高考(NCEE)数据:来源于北京大学中国教育财政科学研究所,涵盖了2005-2011年间来自2227个县城的学生的总成绩和ID。观察值包括了每年约200万学生,学生ID有六位,涵盖的住址信息可以用来匹配天气数据。学生ID还可以用于区分学生的文理分科,以用于探索文理科学生之间的异质性。
录取分数:各省每年一本线成绩来源于专门的考试网站(gaokao.com)
天气数据:来源于国家气象信息中心,涵盖了中国752个气象站的每日最高、最低和平均温度、降水、相对湿度、风速、日照时长和气压。平均而言,每个县城有0.34个气象站;能见度数据来源于美国国家海洋和大气管理局。作者从中提取了考试期间的天气数据,并通过反距离权重插值(IDW)的方法将之转化为县城尺度的数据(算法原理:将县城作为质心,半径200公里以内的气象站的数据加权平均作为该县的数据,权重为各气象站到质心位置的反距离。)
Table 1的Panel A给出了学生成绩的描述性统计情况。Panel B给出了本一高校录取比例的描述性统计情况,Panel C给出了各天气要素的描述性统计情况。数据范围为2005-2011年,完整样本的观测值为12,042,417,文科3,699,915,理科8,972,856,共2227个县城。对于总分不是750分的省份,将评分归一化为750分。天气数据为6月7日与8日的平均值。

Fig.1 描述了考试期间平均温度的分布情况,这一直方图揭示了极大的异质性,温度分布主要在10℃-30℃之间,峰值在25℃处。为了测量温度的非线性影响,作者构建了两个测量量:DD(degree days)作为一个分段线性函数用于描述低于/高于阈值14℃的天数;另一个用于捕获非线性效应的方式是构建一系列2℃的箱,其中最低的包括12℃以下所有温度,最高的包括28℃以上所有温度。

另一个需要重点注意的因素是考试评分会在考后1-2周内由专业的老师在各省省会有空调的旅馆内完成。此外,每一位评分者只改一道题,每题由2名评分者评分,再进行交叉验证。因此,温度对于评分者表现的任何潜在影响在作者评估高考成绩时被进一步最小化。
同时,作者也不是很关心学生的选择,已有研究表明,尽管更聪明的学生会希望推迟他们的考试因为预期考试条件会得到改善,但是推迟的成本太高,学生需要等待整整一年才能再次参加高考(NCEE)。
Empirical strategy
为了评估温度对学生表现的影响,作者构建如下等式:
Yict = α0 + β1*Tct + β2*Wct + γc + ηt + ∈ict
式中,i代表学生个体,c代表考试进行的县城,t代表考试年份;
Yict有2个测量值。一个是对数考试成绩,选择对数是为了增强解释因为点估计值对应于考试成绩相对于温度的半弹性。另一个是一个虚拟变量,当学生的分数大于等于本一线时为1,否则为0。两种方法都使用OLS估计。
Tct代表6月7日和8日的日平均温度(最高气温与最低气温的均值)。
Wct代表一个包含所有天气变量的矩阵,包括降水,相对湿度,风速,日照时间,气压和能见度,与温度变量一致,所有上述变量都选取两天的平均值。
γc代表县城的固定效应,用以控制研究时间段县城的地理、文化、人口等特征是稳定的。ηt代表年份的固定效应,用以控制任何全国性的政策或者经济冲击会随着时间变化但对所有县城的考试的影响是公平的。
因为天气变量是按照县城级别分组的,标准误差可能会下偏,所以按照县城尺度增加误差项∈ict。
作者的识别差异是县一级的,因而避免使用省级从层面的年度固定效应,因为这会吸收数据中的大部分变异并且给定县内短期温度波动的随机性使其不可能与考试难度相关。但是,作者使用省级时间趋势进行了稳健性检验并且发现了相似的结果。
本文关心的系数是βi。当对温度进行线性度量时,这一系数表示考试期间温度每升高1℃总成绩变化的百分比(进入一本高校的可能性的变化);当使用DD时,DD的估计系数表示考试期间在温度大于(小于)14℃温度每升高(降低)1℃总成绩变化的百分比(进入一本高校的可能性的变化);但对于非线性的箱式接近方法时,每一个箱的系数度量了当温度相对于参考温度12-14℃下降到该温度区时总成绩变化的百分比(进入一本高校的可能性的变化),参考区的选择是因为它与最高的考试成绩相关。
Results
主要结果
Table 2 给出了主要的回归结果,其中因变量为总成绩的对数,(1)和(2)为所有学生,(3)和(4)为文科生,(5)和(6)为理科生;(1)(3)(5)温度的度量为6月7日和8日的日均气温,(2)(4)(6)的温度度量为之前描述的DD。
就(1)(3)(5)列而言,所有的估计值都是负数并且在1%的置信区间下显著。对所有学生而言,第(1)列的估计系数表明,温度每升高1℃,总成绩将下降0.34%,即平均得分下降1.76(平均分为518.96),即一个标准偏差的温度升高(3.29℃)会使总测试成绩降低1.12%,相当于标准偏差的9.59%(标准偏差为60.40)。由于作者的模型包括县级固定效应,因此作者还使用县内温度的标准偏差2℃来校准幅度:县城温度每升高一个标准偏差(2℃),会使总测试成绩下降0.68%,相当于标准偏差的5.83%。
就(2)(4)(6)列而言,当DD大于等于14时,对所有学生而言,第(2)列的系数为负且结果显著,并且与(1)列的结果基本一致。这主要是受考试时间的影响,高考的两天全国的平均气温为22.78℃,远超过阈值14℃。与之相对,当DD小于14时,结果在统计意义上不显著。对于不同科目学生而言,作者发现温度的消极影响对于文科生更为显著。
除去温度,作者在回归模型中还考虑了降水、相对湿度、风速、日照时间、气压和能见度这些天气要素。结果表明风速和日照时间有显著的正效应,而降水、相对湿度、气压和能见度的估计情况在统计学意义上不显著。

Fig. 2 绘制了当因变量是考试成绩的对数时,在非参数箱式接近方法下的系数(蓝色)和95%置信区间(灰色),所有估计值都是相对于被省略的12-14℃箱。结果表明,所有温度高于12-14℃的箱的系数单调下降,且幅度与Table 2中Panel A的第(1)列相符合。

学习与认知表现
在这一部分,作者将高考前一整年的温度加入到回归模型当中,目的有二,一是确保认知行为的短期效应不受对学生学习的长期效应的影响,二是识别是否存在长期效应。Table 3. 展示了结果。与基础模型相比,同期温度的回归系数基本不变,但是前一年温度的回归系数很小并且统计意义上不显著;对于DD的回归结果而言,加入前一年温度会产生显著的负面影响。这些发现表明作者所研究的短期行为效应不受长期学习效应的驱动,也证明极端温度会损害学习行为。

机制测试
在作者的基准模型中使用的是日平均温度,即每日最高和最低温度的平均值,因此,作者的估计可以反映两种温度对考试成绩影响的潜在渠道:学生的表现可能会直接受到考试期间高温的损害或者受到极端高温对学生睡眠造成消极影响的间接损害。因为日最高气温和最低气温分别度量了白天和夜晚的温度,作者单独考虑这些变量来揭示这些潜在渠道。
Table 4 中第(1)列重复了基准研究的结果, 第(2)(3)列分别使用最高和最低温度,第(4)列同时考虑了最高和最低温度,第(5)列在基准模型的基础上增加了考试两天温度的差值。结果表明,日最高温度起到重要作用并且强调了直接影响的重要性,同时,考试持续的两天的温度变化也有显著的消极影响。

动态效应
从Fig.3 中,作者发现在考试前一段时间的温度的明显消极影响,因为滞后的温度可能会影响学生对考试的准备。相反,当作者加入考试后一段时间的温度时,效果变小,最终变得微不足道。

空调的作用
已有研究表明空调可以保护人体免受过高温度的影响并且这种防护会影响认知表现。但作者无法获取测试机构是否使用空调的信息,并且出于公平的考虑,在高考考场禁止使用空调因为部分地区不具备这一条件。然而,作者通过将作者的样本划分为城市和乡村区域来间接探索空调的作用(假定在城市区域的考察有更大的可能性拥有空调)。结果表明在城市区域温度的影响更大,尽管这样的差异并不十分显著。
空气污染作为可能的混杂因素
为了验证空气污染在本文模型中是否产生混杂,作者使用API数据来测试空气质量和考试成绩之间的关系。由于只能获得主要城市的API数据,这一分析的样本量有很大缩减。从Table 5. 的结果可以看出,由于加入API数据不会对温度效应项的回归系数产生较大影响,可以说明空气污染不会对作者的结果产生影响。当然,作者还进一步用2013-2016年的数据对PM2.5的影响进行验证,结果显示PM2.5在作者的研究设定中也不会产生太大影响。

异质性分析
Table 6. 展示了将县城划分为温差超过平均值和低于平均值两类,尽管在温度较高县城的效应略低于温度较低县城,标准差的结果显示它们在统计学意义上没有明显的差异,交叉项验证的结果也相似。
Table 7. 通过人均GDP划分县城的富裕程度,结果显示在富裕地区的股聚酯略高于贫困地区,但在统计意义上也没有显著差异,交叉项验证的结果也相似。
Fig. 4 探索了学生成绩的异质性影响。从图中的结果可以看出,随着学生成绩排名百分比的上升,估计的系数明显下降,说明考试能力强的学生对于温度更加敏感,而能力较弱的学生受环境条件的影响较小。

温度对进入精英大学/机构的影响
Table 8. 和Fig.5 将因变量替换为进入一本大学的可能性,对所有学生而言,第(1)列中的估计系数表明,温度每升高1℃,进入一本大学的可能性下降0.60%,相当于标准偏差的1.33%(标准偏差为0.45)。第二列使用DD的估计结果表明,14℃以上温度每升高1℃,进入一本大学的可能性也下降0.60%,同样,这一影响在文科生中更加明显。然而,其他天气变量的影响有所不同,降水,湿度和气压的回归系数都在统计意义上显著,并且小于用均值估算的结果,能见度的回归系数是负的,并且系数值较大且在统计意义上显著,Fig.5 的非线性测试的情况也表现了相似的结果。

鲁棒性检验
Table 9. 展现了对主要结果的鲁棒性检验,第(2)-(8)列通过对基准回归模型中变量的不同替换和统计学检验,其结果都表明,回归模型的结果是稳健的。

气候情景预测
Fig.6 预测了2070-2099年在RCP8.5情境下每个县城的情况,从图中可以看出,西部的县城学生成绩的下降更大,这说明了在气候变化情境下省内不公平的加剧和省际间效率分配的失衡。

Discussion and Conclusion
本文中,通过对中国高考数据的分析,作者发现温度对于高风险的认知行为有着重要的作用,具体而言,在考试期间1℃温度的升高会导致总成绩下降一个标准偏差的2.91%。此外,本文的研究还发现在各省内,高温地区的考生占有劣势。研究强调了对于中国高考体制下录取公平性的关注,并且作者认为安装和使用空调是一个很好的解决措施。
就研究意义而言,尽管本文的实证背景设定都在中国,研究结果对于其他通过标准化考试决定高等教育录取的发展中国家同样具有参考意义。同时,温度对于认知行为的显著影响也表明未来气候变化会对经济福祉产生潜在的影响。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存